Model Selection

Speech recognition fine-tuning

# Speech recognition fine-tuning

Wav2vec2 Large Xlsr 53 English Pronunciation Evaluation Aod Cut Balance

English pronunciation assessment model based on wav2vec2-large-xlsr-53 for evaluating English pronunciation quality

Audio Classification

A speech processing model fine-tuned based on facebook/wav2vec2-base, with an accuracy of 28.57%

Speech Recognition

Wav2vec2 Nsc Final 2 Google Colab

A speech processing model fine-tuned based on facebook/wav2vec2-base, specific purpose not clearly stated

Speech Recognition

Wav2vec2 Base Librispeech Demo Colab

This model is a speech recognition model fine-tuned on the LibriSpeech dataset based on facebook/wav2vec2-base, suitable for English speech-to-text tasks.

Speech Recognition

This model is a fine-tuned speech processing model based on facebook/wav2vec2-base, with no specific use case explicitly stated

Speech Recognition

Wav2vec2 Base Toy Train Data Random Low Pass

This model is a speech recognition model fine-tuned on an unknown dataset based on facebook/wav2vec2-base, primarily used for Automatic Speech Recognition (ASR) tasks.

Speech Recognition

Wav2vec2 Large Xlsr 53 Toy Train Data Masked Audio 10ms

Speech recognition model fine-tuned based on facebook/wav2vec2-large-xlsr-53, optimized on 10ms audio masked training data

Speech Recognition

Wav2vec2 Base Toy Train Data Masked Audio 10ms

A speech recognition model fine-tuned based on facebook/wav2vec2-base, trained on 10ms masked audio tasks

Speech Recognition

Wav2vec2 Base Toy Train Data Augment 0.1

A speech recognition model fine-tuned from facebook/wav2vec2-base, trained on a toy dataset with 0.1 ratio data augmentation applied

Speech Recognition

Wav2vec2 Large Xlsr 53 Toy Train Data Augment 0.1.csv

This model is a speech recognition model fine-tuned from facebook/wav2vec2-base, trained using data augmentation techniques

Speech Recognition

Wav2vec2 Base Toy Train Data Augment 0.1.csv

This model is a fine-tuned speech recognition model based on facebook/wav2vec2-base, utilizing data augmentation techniques (augmentation ratio of 0.1).

Speech Recognition

Sew D Small 100k Ft Timit

An automatic speech recognition model fine-tuned on the TIMIT_ASR dataset based on asapp/sew-d-small-100k

Speech Recognition

patrickvonplaten

Sew D Small 100k Timit

This model is an automatic speech recognition model fine-tuned from asapp/sew-d-small-100k on the TIMIT_ASR - NA dataset, achieving a word error rate of 0.8061 on the evaluation set.

Speech Recognition

patrickvonplaten

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase